دسته بندی داده های دورده ای با ابرمستطیل موازی محورهای مختصات

Authors

زهرا مصلحی

zahra moslehi isfahan university of technologyاصفهان- دانشگاه صنعتی اصفهان- آزمایشگاه شناسایی الگو و محاسبات نرم مازیار پالهنگ

maziar palhang isfahan university of technologyاصفهان- دانشگاه صنعتی اصفهان- آزمایشگاه هوش مصنوعی

abstract

یکی از زمینه های فعالیت در یادگیری ماشین و شناسایی الگو یادگیری با ناظر می باشد. در یادگیری با ناظر برچسب داده های آموزشی موجود است. در مسایل دورده ای، هدف محاسبه فرضیه ای است که بتواند به بهترین شکل ممکن و با کمترین مقدار خطا داده های با دو ردهی مثبت و منفی را از یکدیگر جدا کند. انواع روش های یادگیری با ناظر پیشنهاد شده است. به عنوان مثال می توان به درخت های تصمیم، یادگیر svm و روش های نزدیکترین همسایه اشاره کرد. در این مقاله بر عملکرد درخت های تصمیم متمرکز می شویم. عملکرد درخت تصمیم مشابه پیدا کردن ابرصفحه های تقسیم کننده در فضای d بعدی است، بطوریکه داده های موجود را به درستی رده بندی کند و تا حد ممکن رده بندی صحیح داده های آینده را نیز بدست آورد. دیدگاه هندسی عملکرد درخت تصمیم ما را به مفهوم تفکیک پذیری در هندسه محاسباتی نزدیک می کند. از بین کلیه الگوریتم های تفکیک پذیری موجود، مساله محاسبه مستطیل با حداکثر اختلاف دو رنگ را مطرح می کنیم. این مساله ارتباط نزدیکی با مساله درخت تصمیم در یادگیری ماشین دارد. در ادامه الگوریتم محاسبه مستطیل با حداکثر اختلاف دو رنگ را در یک، دو، سه و d بعد پیاده سازی می کنیم. نتیجه پیاده سازی نشان دهنده آن است که این الگوریتم، الگوریتمی قابل رقابت با الگوریتم شناخته شده c4.5 است.

Already have an account?login

similar resources

دسته‌بندی داده‌های دورده‌ای با ابرمستطیل موازی محورهای مختصات

One of the machine learning tasks is supervised learning. In supervised learning we infer a function from labeled training data. The goal of supervised learning algorithms is learning a good hypothesis that minimizes the sum of the errors. A wide range of supervised algorithms is available such as decision tress, SVM, and KNN methods. In this paper we focus on decision tree algorithms. When we ...

full text

ارائه یک الگوریتم خوشه بندی برای داده های دسته ای با ترکیب معیارها

Clustering is one of the main techniques in data mining. Clustering is a process that classifies data set into groups. In clustering, the data in a cluster are the closest to each other and the data in two different clusters have the most difference. Clustering algorithms are divided into two categories according to the type of data: Clustering algorithms for numerical data and clustering algor...

full text

رویکرد شبیه‌سازی در حل مسأله زمان‏بندی ماشین‏ های موازی پردازشگر دسته ‏ای با زمان‏ های احتمالی

در این مقاله، مسأله‏ زمان‏بندی ماشین‏های موازی پردازشگر دسته‏ای با هدف حداقل کردن حداکثر زمان تکمیل کارها بررسی می‌شود. نوآوری این پژوهش، به کارگیری زمان های پردازش و در دسترس بودن کارها به صورت احتمالی است. در تحقیقات پیشین اثبات شده است که مسأله‏ مورد بررسی دارای پیچیدگی سخت است. بنابراین، از روش‏های ابتکاری برای حل مسأله استفاده می‏شود. مسأله مورد مطالعه، دو مرحله تصمیم‌گیری دارد. در مرحله ا...

full text

ارائه یک الگوریتم خوشه بندی برای داده های دسته ای با ترکیب معیارها

خوشه بندی یکی از تکنیک های اصلی داده کاوی است. خوشه بندی فرایندی است که مجموعه داده ها را داخل گروه هایی طبقه بندی می کند. در خوشه بندی داده های موجود در یک خوشه بیشترین شباهت را به هم دارند و داده های موجود در دو خوشه متفاوت بیشترین تفاوت را با هم دارند. الگوریتم های خوشه بندی با توجه به نوع داده ها به دو دسته تقسیم می شوند: الگوریتم های خوشه بندی داده های عددی و الگوریتم های خوشه بندی داده ها...

full text

روشی کارا برای پیاده‌سازی موازی الگوریتم دسته بندی بسته درخت سلسله‌مراتبی بر روی واحد پردازش گرافیکی

چکیده: دستهبندی بستهها، پردازشی اساسی در پردازندههای شبکهای است. در این فرآیند، بستههای ورودی از طریق تطبیق با مجموعهای از فیلترها به جریانهای مشخص طبقهبندی میشوند. پیاده‌سازی‌های نرم‌افزاری الگوریتمهای دستهبندی با وجود هزینه کم‌تر و توسعه‌پذیری بیش‌تر نسبت به پیاده‌سازیهای سخت‌افزاری، سرعت پایین‌تری دارند. در این مقاله، از قابلیت پردازش موازی پردازنده‌های گرافیکی برای تسریع الگوری...

full text

دسته بندی داده های جریانی فازی با استفاده از تحلیل پوششی داده ها

در این تحقیق یک روش دسته بندی داده های غیرقطعی از نوع فازی که از جمله چالش برانگیزترین حوزه های تحلیل داده محسوب می شود، ارائه شده است. در واقع حجم بالا و پیچیدگی روش های تحلیل داده مانع از توسعه روش هایی جهت تحلیل داده های فازی می شود. با این حال در برخی حوزه های دیگر همچون برنامه ریزی ریاضی پیشرفت های چشمگیری در مدل سازی سیستم هایی که داده های فازی از آنها در اختیار است، بدست آمده است و لذا ت...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}

Journal title:

فناوری اطلاعات و ارتباطات ایران

جلد ۷، شماره ۲۵، صفحات ۱-۱۴

Keywords

یادگیری ماشین دسته بندی درخت تصمیم هندسه محاسباتی تفکیک پذیری مستطیل.

Hosted on Doprax cloud platform doprax.com